在上一章講到人臉辨識系統有三個步驟,人臉偵測、特徵擷取、人臉識別。
在人臉偵測部分常見的有Haar-like features、OpenCV中的Dlib、Multi-task Cascaded Convolutional Networks這三種。
Haar-like features(哈爾特徵)
找出影像中相對應的像素差值,每個算出來的特徵值都對應一個弱分類器,每個弱分類器指代表一個haar-like特徵影像,將所有的的弱分類器做聯集,組成強分類器再去做判斷。
優點:運算數度較快
Dlib
是OpenCV中所提供的套件,人臉偵測器來偵測圖片中所有人臉的位置,最後再將所有偵測出的人臉位置用綠色方框標示出來。
分別有5個特徵點和68個特徵點
Multi-task Cascaded Convolutional Networks(MTCNN)
使用三個網路Proposal Network(P-Net)、Refine Network(R-Net)、Output Network(O-Net)
Proposal Network(P-Net) 選出候選框(bounding box)
Refine Network(R-Net) 去除一些圈出不是人臉的候選框
Output Network(O-Net) 將剩下的候選框做交集,圈出正確的人臉。